Entrega Final - Series Cronológicas

Facultad de Ciencias Económicas y Administración - 2025 - UDeLaR

Author

Leandro Berrueta, Lucca Frachelle, Cecilia Waksman

Published

June 17, 2025

Se dispone de una serie mensual con la cantidad de clientes con deuda vigente en el Banco Santander en el período Diciembre - 2018 a Marzo - 2025.

Una primera visualización de la serie permite identificar una clara tendencia creciente a lo largo del tiempo, especialmente a partir de 2020, con un aumento significativo hacia 2024.

En principio no se logra reconocer un comportamiento estacional evidente o un patrón repetitivo a intervalos fijos en la serie.

La variabilidad parece aumentar ligeramente con el nivel de la serie, lo que podría sugerir la necesidad de aplicar una transformación logarítmica a modo de homogeneizar la Varianza de la serie. El uso de dicha transformación se evaluará más adelante tomando como insumo el comportamiento de los residuos.

1 Análisis Inicial

1.1 Gráfico de la Serie Temporal

1.2 Estadísticas Descriptivas

Estadísticas Descriptivas de la Serie de Cantidad de Personas con Deuda
Estadística Valor
Min. 332198
1st Qu. 353424
Median 398162
Mean 399505
3rd Qu. 435553
Max. 504989

2 Identificación del Modelo

2.1 Análisis en el Dominio del Tiempo

2.1.1 Función de Autocorrelación (FAC)

Se observa que la Función de Aucorrelación (FAC) decrece lentamente y de forma persistente, con coeficientes de autocorrelación significativos que se mantienen altos incluso en rezagos grandes y que, por ende, no se comportan de acuerdo al decaimiento exponencial que caracteriza a las series débilmente estacionarias1. Esto es un fuerte indicio de que la serie no es estacionaria.

Además, las autocorrelaciones significativas en rezagos altos sugieren la presencia de una tendencia, detalle claramente observable al inspeccionar el gráfico de la serie.

2.1.2 Función de Autocorrelación Parcial (FACP)

La Función de Aucorrelación Parcial (FACP) muestra un coeficiente significativo en el primer rezago y luego decae rápidamente, no habiendo otro rezago que resulte significativo al nivel de significación usual del 5%.

Esto podría sugerir un componente AR(1) si la serie fuera estacionaria. Sin embargo, dada la FAC planteada anteriormente, se concluye de este primer análisis del Dominio del Tiempo en la necesidad de aplicar, al menos, una primera diferencia regular a la serie.

2.2 Análisis en el Dominio de Frecuencias

Mediante el Periodograma Suavizado de la serie es posible respaldar la idea de que la misma presenta una tendencia que debería ser modelada.

En particular, las frecuencias más próximas a 0, y por ende las asociadas a ciclos de período próximo a infinito (el componente tendencial) explica la mayor parte de la variabilidad de la serie2.

2.3 Serie Diferenciada de acuerdo a la Primera Diferencia Regular

2.4 FAC y FACP de la Serie Diferenciada

{r}

Al analizar la Función de Autocorrelación de la serie de Cantidad de Personas con Deuda en Santander una vez aplicada la primera diferencia regular (\(d=1\)), se observa que, aunque la tendencia lineal ha sido eliminada (lo que se corrobora con los tests de Dickey-Fuller Aumentado y KPSS, CHEQUEAR UNA VEZ DADOS TEST DE RAICES UNITARIAS), persisten patrones de Autocorrelación significativos.

Específicamente, se nota la presencia de coeficientes significativos en el rezago 3, en el rezago 6 y en el rezago 9, con una rápida aproximación a las bandas de confianza3.

De esta manera se puede destacar que las observaciones se encuentran autocorrelacionadas con sus valores de 3, 6 y 9 meses atrás. Dado que estos rezagos son múltiplos de 3 es que se plantea modelar una estacionalidad de tipo trimestral. Para ello se aplicará una Primera Diferencia Estacional asociada al rezago \(k = 3\).

2.5 Serie Diferenciada de acuerdo a la Primera Diferencia Regular y Primera Diferencia Estacional (Trimestral)

2.6 Gráfico de la Serie Diferenciada Estacional

2.7 FAC y FACP de la Serie Diferenciada (Regular y Estacional)

2.8 Serie Diferenciada de acuerdo a la Primera Diferencia Regular y Primera Diferencia Estacional (Anual)

2.9 Gráfico de la Serie Diferenciada Estacional Anual

2.10 FAC y FACP de la Serie Diferenciada (Regular y Estacional Anual)

3 Modelos Propuesto

3.1 Exploración del Modelo ARIMA(3,1,0)

3.1.1 Ajuste del Modelo ARIMA(3,1,0)

Coeficientes del Modelo ARIMA(3,1,0)
Término Beta1 SE
ar1 -0.16 0.100
ar2 -0.04 0.101
ar3 0.48*** 0.100
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001

3.1.2 Criterios de Información del Modelo ARIMA(3,1,0)

Criterios de Información del Modelo ARIMA(3,1,0)
AIC AICc BIC
1533.778 1534.35 1543.048

3.1.3 Diagnóstico de los Residuos del Modelo ARIMA(3,1,0)

3.1.3.1 FAC y FACP de los Residuos

3.2 Exploración del Modelo SARIMA(3,1,0)(0,1,0)[12]

Como los FAC y FACP de la serie con primera diferencia regular muestran una relación significativa en el rezago 12, se va a explorar un modelo SARIMA(3,1,0)(0,1,0)[12].

3.2.1 Ajuste del Modelo SARIMA(3,1,0)(0,1,0)[12]

Coeficientes del Modelo SARIMA(3,1,0)(0,1,0)[12]
Término Beta1 SE
ar1 -0.11 0.124
ar2 0.00 0.125
ar3 0.23 0.124
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001

3.2.2 Criterios de Información del Modelo SARIMA(3,1,0)(0,1,0)[12]

Criterios de Información del Modelo SARIMA(3,1,0)(0,1,0)[12]
AIC AICc BIC
1300.059 1300.749 1308.632

3.2.3 Medidas de Error del Modelo SARIMA(3,1,0)(0,1,0)[12]

Medidas de Error del Modelo SARIMA(3,1,0)(0,1,0)[12] en el Conjunto de Entrenamiento
Conjunto ME RMSE MAE MPE MAPE MASE ACF1
Training set 253.8599 6250.746 4450.923 0.0479291 1.092867 0.1687837 -0.0300656

3.2.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(3,1,0)(0,1,0)[12]

Resultados de las Pruebas de Raíz Unitaria (ADF y KPSS) en los Residuos del Modelo SARIMA(3,1,0)(0,1,0)[12]
Test Statistic p_value Method
ADF Test -3.3623748 0.0681654 Augmented Dickey-Fuller Test
KPSS Test 0.1450357 0.1000000 KPSS Test for Level Stationarity

3.2.5 Diagnóstico de los Residuos del Modelo SARIMA(3,1,0)(0,1,0)[12]

3.2.5.1 Gráfico de Residuos

3.2.5.2 FAC y FACP de los Residuos

3.2.5.3 Test de Ljung-Box

Resultados del Test de Ljung-Box para los Residuos del SARIMA(3,1,0)(0,1,0)[12]
Test Estadistico p_value Metodo Parametro
Ljung-Box (Lag 10) 2.939612 0.8905319 Box-Ljung test 7
Ljung-Box (Lag 20) 24.879731 0.0974341 Box-Ljung test 17

3.2.5.4 Análisis de Homocedasticidad

3.2.5.5 Análisis de Normalidad

3.2.5.6 Tests de Normalidad

Resultados de los Tests de Normalidad para los Residuos del SARIMA(3,1,0)(0,1,0)[12]
Test Estadistico p_value Metodo
Shapiro-Wilk 0.9679064 0.0511602 Shapiro-Wilk normality test
Jarque-Bera 5.4385214 0.0659235 Jarque Bera Test

3.3 Exploración del Modelo SARIMA(0,1,0)(3,1,0)[3] con Componente Estacional Trimestral AR(3)

Dado que se observaron picos en los meses de marzo, junio, septiembre y diciembre en el gráfico estacional, lo que sugiere una estacionalidad trimestral, exploraremos un modelo SARIMA que incorpore esta periodicidad. Específicamente, se propone un modelo SARIMA(0,1,0)(3,1,0)[3], que aplica una diferencia regular (d=1) y una diferencia estacional trimestral (D=1, período=3), además de incluir un componente autorregresivo estacional de orden 3 (P=3) para capturar la dependencia en los rezagos trimestrales.

3.3.1 Ajuste del Modelo SARIMA(0,1,0)(3,1,0)[3]

Coeficientes del Modelo SARIMA(0,1,0)(3,1,0)[3]
Término Beta1 SE
sar1 -0.67*** 0.111
sar2 -0.51*** 0.128
sar3 -0.39*** 0.118
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001

3.3.2 Criterios de Información del Modelo SARIMA(0,1,0)(3,1,0)[3]

Criterios de Información del Modelo SARIMA(0,1,0)(3,1,0)[3]
AIC AICc BIC
1465.897 1466.494 1475.003

3.3.3 Medidas de Error del Modelo SARIMA(0,1,0)(3,1,0)[3]

Medidas de Error del Modelo SARIMA(0,1,0)(3,1,0)[3] en el Conjunto de Entrenamiento
Conjunto ME RMSE MAE MPE MAPE MASE ACF1
Training set 247.7342 5768.175 4139.837 0.0494375 1.038639 0.156987 -0.2086285

3.3.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(0,1,0)(3,1,0)[3]

Resultados de las Pruebas de Raíz Unitaria (ADF y KPSS) en los Residuos del Modelo SARIMA(0,1,0)(3,1,0)[3]
Test Statistic p_value Method
ADF Test -3.5471007 0.0437844 Augmented Dickey-Fuller Test
KPSS Test 0.0982678 0.1000000 KPSS Test for Level Stationarity

3.3.5 Diagnóstico de los Residuos del Modelo SARIMA(0,1,0)(3,1,0)[3]

3.3.5.1 Gráfico de Residuos

3.3.5.2 FAC y FACP de los Residuos

3.3.5.3 Test de Ljung-Box

Resultados del Test de Ljung-Box para los Residuos del SARIMA(0,1,0)(3,1,0)[3]
Test Estadistico p_value Metodo Parametro
Ljung-Box (Lag 10) 5.169803 0.6392500 Box-Ljung test 7
Ljung-Box (Lag 20) 18.045584 0.3859706 Box-Ljung test 17

3.3.5.4 Análisis de Homocedasticidad

3.3.5.5 Análisis de Normalidad

3.3.5.6 Tests de Normalidad

Resultados de los Tests de Normalidad para los Residuos del SARIMA(0,1,0)(3,1,0)[3]
Test Estadistico p_value Metodo
Shapiro-Wilk 0.9613234 0.0206083 Shapiro-Wilk normality test
Jarque-Bera 7.3869629 0.0248852 Jarque Bera Test

3.4 Exploración del Modelo SARIMA(3,1,0)(3,1,0)[3] con Componentes Normales y Estacionales Trimestrales

Basándonos en la posible relevancia de los componentes no estacionales y la fuerte evidencia de estacionalidad trimestral, se propone explorar un modelo SARIMA más completo: el SARIMA(3,1,0)(3,1,0)[3]. Este modelo incorpora una diferencia regular (d=1) para la tendencia, un componente autorregresivo no estacional de orden 3 (p=3), una diferencia estacional trimestral (D=1, período=3) y un componente autorregresivo estacional de orden 3 (P=3).

3.4.1 Ajuste del Modelo SARIMA(3,1,0)(3,1,0)[3]

Coeficientes del Modelo SARIMA(3,1,0)(3,1,0)[3]
Término Beta1 SE
ar1 -0.24* 0.122
ar2 -0.10 0.127
ar3 -0.16 0.288
sar1 -0.53 0.284
sar2 -0.40* 0.165
sar3 -0.31* 0.139
Abbreviations: CI = Confidence Interval, SE = Standard Error
1 *p<0.05; **p<0.01; ***p<0.001

3.4.2 Criterios de Información del Modelo SARIMA(3,1,0)(3,1,0)[3]

Criterios de Información del Modelo SARIMA(3,1,0)(3,1,0)[3]
AIC AICc BIC
1468.075 1469.825 1484.011

3.4.3 Medidas de Error del Modelo SARIMA(3,1,0)(3,1,0)[3]

Medidas de Error del Modelo SARIMA(3,1,0)(3,1,0)[3] en el Conjunto de Entrenamiento
Conjunto ME RMSE MAE MPE MAPE MASE ACF1
Training set 374.1794 5631.726 4070.608 0.0763067 1.012419 0.1543617 -0.0068667

3.4.4 Pruebas de Raíz Unitaria en los Residuos del SARIMA(3,1,0)(3,1,0)[3]

Resultados de las Pruebas de Raíz Unitaria (ADF y KPSS) en los Residuos del Modelo SARIMA(3,1,0)(3,1,0)[3]
Test Statistic p_value Method
ADF Test -3.3307532 0.0732656 Augmented Dickey-Fuller Test
KPSS Test 0.1209984 0.1000000 KPSS Test for Level Stationarity

3.4.5 Diagnóstico de los Residuos del Modelo SARIMA(3,1,0)(3,1,0)[3]

3.4.5.1 Gráfico de Residuos

3.4.5.2 FAC y FACP de los Residuos

3.4.5.3 Test de Ljung-Box

Resultados del Test de Ljung-Box para los Residuos del SARIMA(3,1,0)(3,1,0)[3]
Test Estadistico p_value Metodo Parametro
Ljung-Box (Lag 10) 2.564114 0.9221923 Box-Ljung test 7
Ljung-Box (Lag 20) 13.293879 0.7163012 Box-Ljung test 17

3.4.5.4 Análisis de Homocedasticidad

3.4.5.5 Análisis de Normalidad

3.4.5.6 Tests de Normalidad

Resultados de los Tests de Normalidad para los Residuos del SARIMA(3,1,0)(3,1,0)[3]
Test Estadistico p_value Metodo
Shapiro-Wilk 0.967282 0.0468881 Shapiro-Wilk normality test
Jarque-Bera 5.313698 0.0701690 Jarque Bera Test

3.5 Comparación de Modelos SARIMA

Footnotes

  1. En el presente trabajo se utilizará como sinónimos “estacionariedad en sentido débil”, “estacionariedad en covarianza” y “estacionariedad”, al igual que se hizo durante el desarrollo del curso.↩︎

  2. Corresponde resaltar, sin embargo, que la relación entre el área que se encuentra por debajo del Espectro/Periodograma y la Varianza de la serie se plantea para series estacionarias, propiedad que claramente no caracteriza a la serie en tratamiento.↩︎

  3. El coeficiente asociado al rezago 12 también es significativo, aunque como su magnitud es mayor a la del coeficiente del rezago 9 se decide, en principio, trabajar con los rezagos \(k = 3, 6, 9\). Si bien 12 es múltiplo de 3 y por ende su significación puede estar ligada a la trimestralidad, no se debe descartar que pueda existir un componente de estacionalidad anual.↩︎